|
1.
基于云计算和改进
K-means算法的海量用电数据分析方法
张承畅, 张华誉, 罗建昌, 何丰
计算机应用
2018, 38 (1):
159-164.
DOI: 10.11772/j.issn.1001-9081.2017071660
针对小区居民用电数据挖掘效率低、数据量大等难题,进行了基于云计算和改进
K-means算法的海量用电数据分析方法研究。针对传统
K-means算法中存在初始聚类中心和
K值难确定的问题,提出一种基于密度的
K-means改进算法。首先,定义样本密度、簇内样本平均距离的倒数和簇间距离三者乘积为权值积,通过最大权值积法依次确定聚类中心,提高了聚类的准确率;然后,基于MapReduce模型实现改进算法的并行化,提高了聚类的效率;最后,以小区400户家庭用电数据为基础,进行海量电力数据的挖掘分析实验。以家庭为单位,提取出用户的峰时耗电率、负荷率、谷电负荷系数以及平段用电量百分比,建立聚类的数据维度特征向量,完成相似用户类型的聚类,同时分析出各类用户的行为特征。基于Hadoop集群的实验结果证明提出的改进
K-means算法运行稳定、可靠,具有很好的聚类效果。
参考文献 |
相关文章 |
多维度评价
|
|